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The trouble with programmers is that you can never tell what a programmer is 
doing until it's too late. 

- Seymour Cray 

As soon as we started programming, we found out to our surprise that it wasn't 
as easy to get programs right as we had thought. Debugging had to be 
discovered. I can remember the exact instant when I realized that a large part 
of my life from then on was going to be spent in finding mistakes in my own 
programs. 

- Maurice Wilkes - 1949 



If debugging is the process of removing bugs, then programming must be the 
process of putting them in. 

- Edsger W. Dijkstra 
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Referencias 


históricas 







Evolución desde el punto de vista de la Arquitectura (Lenguaje Máquina): 

■ 1978. Se anuncia el ¡8086 como una extensión del ¡8080. El ¡8086 es un microprocesador de 16 bits. Se 
queda a medio camino entre una máquina de acumulador y una máquina de registros de propósito general. 

■ 1980. Se anuncia el ¡8087, coprocesador en coma flotante. El LM del ¡8086 se amplía con 60 instrucciones. 
Se abandona el concepto de acumulador y se utiliza un híbrido entre un banco de registros y una pila para 
las operaciones en coma flotante. 

■ 1982. El ¡80286 aumenta el espacio de direcciones a 24 bits. Se ofrece el real addressing mode para seguir 
ejecutando aplicaciones ¡8086. 

■ 1985. El ¡80386 extiende la arquitectura a 32 bits. Se añaden nuevos modos de direccionamiento e 
instrucciones. El nuevo procesador es casi una máquina de registros de propósito general. 

■ En los siguientes procesadores apenas hay cambios en la Arquitectura (4 nuevas instrucciones en 10 años). 

■ 1997. El Pentium MMX incluye instrucciones para aplicaciones multimedia (MMX). El conjunto de 
instrucciones multimedia se ha ido aumentando en los siguientes procesadores: SSE (Pentium III, 1999), 
SSE2 (Pentium 4, 2001), SSE3 (Pentium 4 Prescott, 2005; ampliado AMD Athlon, 2005), SSE4 (Core y AMD 
K10, 2007). 



■ 2003. AMD realiza la extensión de la arquitectura a 64 bits. Los registros aumentan a 64 bits y se aumenta 
su número a 16. Intel tuvo que copiar esta extensión. 




Referencias históricas 



Lenguaje Máquina MIPS (características RISC) 

■ Instrucciones aritméticas acceden sólo a 
registros 

• En algunos casos un operando puede 
ser inmediato 

■ Solo las instrucciones Load y Store pueden 
accede a memoria. 

■ Referencias a memoria con modos de 
direccionamiento simples 

• Base + Desplazamiento 

■ Instrucciones de longitud fija 

■ Muchos registros 



Lenguaje Máquina x86 (características CISC) 

■ Instrucciones pueden referenciar 
diferentes tipos de operandos 

• inmediato, registros, memoria 

■ Instrucciones aritméticas pueden 
leer/escribir en memoria, pero sólo 1 de 
los 2 operandos puede estar en memoria 

■ Referencias a memoria pueden suponer 
cálculos complejos 

• Rb + S*Ri + D 

■ Instrucciones pueden tener diferente 
longitud 

■ Pocos registros 



Visión del programador 



Registros visibles 
desde LM 



EFLAGS (ce) 



Código Objeto 



Datos Programa 



INSTRUCCIONES 



EIP: Contador de programa. Apunta a la siguiente instrucción a ejecutar 
Registros: Se usan muy frecuentemente como variables de acceso rápido 
Códigos de Condición 

• Almacenan información respecto al comportamiento de las últimas instrucciones ejecutadas 

• Se usan en los saltos condicionales 
Memoria 

• Vector direccionable a nivel de byte, Little endian 

• Código, datos usuario, datos SO 

• Pila para soportar gestión de subrutinas 



Visión del programador 

■ EIP: Contador de programa. Apunta a la siguiente instrucción a ejecutar 

■ Registros: Se usan muy frecuentemente como variables de acceso rápido 

■ Códigos de Condición 

• Almacenan información respecto al comportamiento de las últimas instrucciones 
ejecutadas 

• Se usan en los saltos condicionales 

■ Memoria 

• Vector direccionable a nivel de byte, Little endian 

• Código, datos usuario, datos SO 

• Pila para soportar gestión de subrutinas 




Características del ensamblador 



■ Tipos de datos básicos 

• Enteros 

S dato de 1, 2 ó 4 bytes 

S datos y direcciones (punteros) 

• Reales (coma flotante): 4, 8 ó 10 bytes 

• No incluye tipos estructurados 

S Se codifican como datos almacenados de forma contigua 

■ Operaciones primitivas 

• Operaciones aritméticas sobre registros y datos en memoria 

• Transferencia de datos entre memoria y banco de registros 

• Saltos condicionales e incondicionales (a/de procedimientos) 




Visión del programador 



¿Qué necesitamos estudiar? 

• Espacio de memoria 

• Registros disponibles 

• Repertorio de instrucciones: qué hacen, cómo se codifican, cuánto tardan 

• Tipos y representación de los datos 

• Modos de direccionamiento 

• Secuenciamiento de instrucciones 

• Comunicación con el exterior 



Visión del programador 



Espacio de memoria 

• Espacio lineal de 2 32 posiciones de 1 byte 

• Modo protegido / Modelo plano de memoria/ Little endian 

Registros disponibles 



32 bits 



%esp 



%ebp 



%eflags 



16 bits 



%sp 



8 bits 



%bh, %bl 



%dh, %dl 





AH AL 


AX 


EAX 



Reservados para uso específico de 
subrutinas 



Contador programa 



Palabra de estado 







Tipos de 


datos básicos 






Operacones „ | bytg | 

básicas con 1 1 y 

enteros » ^^^^^^ 

\ MeH byteL word 
\ @+l @ 

V 

Coma flotante word H word L | longword 
N \ s ^ @+3 @+2 @+l 


longword H longword L quadword 


@+7 @+6 


@+5 @+4 @+3 @+2 @+l @ 












Tipos de 


datos básicos 






0 

1 

2 
3 
4 
5 
6 
7 
8 
9 
10 
11 
12 
13 
14 
15 


34 
22 
5A 
3B 
Cl 
45 
FF 
00 
21 
2A 
2C 
7B 
90 
43 
11 
FF 


byte 8: 0x21 
byte 3: 
word 8 : 
word 3: 
longword 8 : 
longword 3 : 
quadword 8 : 
quadword 3 : 

i Little Endian ! 









Tipos de datos básicos 



byte 8 
byte 3 
word 8 
word 3 
longword 8 
longword 3 
quadword 8 
quadword 3 



0x21 



i Big Endian ! 



Tipos de datos básicos 



Rango Naturales 

■ byte: 0<x< 255 

■ word: 0<x< 65.535 

■ longword: 0<x<4. 294.967.215 

Rango Enteros 

■ byte: -128 <x< 127 

■ word: -32.768 <x< 32.767 

■ longword: -2.147.483.648 < x < 2.147.483.647 

Rango Reales (IEEE 754) 

■ Precisión simple (32 bits, 24 precisión): 1,18-10" 38 < x < 3,40-10 38 

■ Precisión doble (64 bits, 53 precisión): 2,23-10" 308 < x < 1,79-10 308 

■ Precisión doble extendida (80 bits, 64 precisión): 3,37-10 4932 < x < 1,18-10 4932 




Modos de direccionamiento 



■ Inmediato: $19, $-3, $0x2A, $0x2A45 

• Codificado con 1,2 ó A- bytes 

■ Registro: %eax, %ah, %esi 

■ Memoria: D(Rb, Ri, s) -> M[Rb+Rixs+D] 

• D: desplazamiento codificado con 1, 2 ó 4 bytes 

• Rb: registro base. Cualquiera de los 8 registros 

• Ri: registro índice. Cualquiera excepto %esp 

• S: factor escala: 1, 2, 4 u 8 




Modos de direccionamiento 



■ Ejemplos de modos de direccionamiento: 

(%eax,%ebx) M[eax+ebx] 

-3 (%eax, %ebx) 

(%eax, %ebx, 4) 

(, %ebx,4) 

12 (%eax) 

(%eax) 

3 (%eax, %esi, 2) 
4 

$4 

%eax 
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Campos opcionales: presentes o no dependiendo de la instrucción 



1-2 bytes 1 byte 1 byte 1, 2, o 4 bytes 1, 2, o 4 bytes 



OpCode 


Modo 


SIB 


Desplazamiento 


Inmediato 



Formato General de las instrucciones 

■ OpCode codifica: 

• la operación a realizar 

• el tamaño de los operandos 

• cuál es el operando fuente y cuál el destino 

• si el operando fuente es un inmediato o registro/memoria 

■ Modo codifica: 

• el modo de direccionamiento del operando memoria si lo hay 

• el registro para los operandos registro 

• indica si hay desplazamiento para el caso de que un operando esté en memoria 

■ SIB, en el caso que uno de los operandos esté en memoria, codifica: 

• el escalado (Scale) 

• registro índice (Index) 

• registro base (Base) 




Codificación del modo memoria 



2 bits 3 bits 3 bits 



OpCode Modo Scale Index Base 



Desplaz. 



banco de registros 



Posibles valores de Scale: 0,1,2,3 (equivale a multiplicar por 1,2,4,8 respectivamente) 
IA-32 Intel® Architecture Software Developer's Manual Volume 2: Instruction Set Reference 



Instrucciones 



■ Movimiento de datos 



Instrucciones 


Descripción 




Ejemplo 


MOVx opl, op2 


Op2 <r- Opl 


x = {L, W, B} 


MOVB $-l,%AL 


MOVSxy opl, op2 


op2 <— ExtSign(opl) 


xy = {BW, BL, WL} 


MOVSBW %CH,%AX 


MOVZxy opl, op2 


op2 <— ExtZero(opl) 


xy = {BW, BL, WL} 


MOVZWL %BX,%EDX 


PUSHLopl 


%ESP^%ESP-4; 
M[%ESP]^opl 




PUSHL 12(%EBP) 


POPLopl 


opl<- M[%ESP]; 
%ESP <- %ESP + 4; 




POPL %EAX 


LEAL opl, op2 


Op2 <r- &Opl 


opl: memoria 


LEAL (%EBX,°/oECX),%EAX 




Instrucciones 



■ Aritméticas 



Instrucciones 


Descripción 




Ejemplo 


ADDx opl, op2 


op2 <- op2+opl 


x = {L, W, B} 


ADDL $13,%EAX 


SUBx opl, op2 


op2 <- op2-opl 


x = {L, W, B} 


SUBW %CX,%AX 


ADCx opl, op2 


op2 <- op2+opl+CF 


x = {L, W, B} 


ADCL %EDX,%EAX 


SBBx opl, op2 


op2 <r- op2-opl-CF 


x = {L, W, B} 


SBBL %ECX,%EAX 


INCx opl 


opl <- opl+1 


x = {L, W, B} 


INCL%EAX 


DECx opl 


opl <- opl-1 


x = {L, W, B} 


DECW %BX 


NEGx opl 


opl <- -opl 


x = {L, W, B} 


NEGL %EAX 




Instrucciones 



■ Aritméticas (2) 



Instrucciones 


Descripción 




Ejemplo 


IMUL opl, op2 


op2 < — op2 - opl 


op2: registro 


IMUL (%EBX),%EAX 


IMUL inm,opl,op2 


op2 <- opl-inm 


¡nm: constante 


IMUL$3,%EAX / %ECX 


IMULLopl 


%EDX%EAX <- opl-%EAX 


opl: mem. o reg. 
(Enteros) 


IMULL(%EBX) 


MULLopl 


%EDX%EAX <- opl-%EAX 


opl: mem. o reg. 
(Naturales) 


MUL L (%EBX) 


CLTD 


%EDX%EAX ExtS¡gn(%EAX) 


x = {L, W, B} 


INCL%EAX 


IDIVLopl 


%EAX <r- %EDX%EAX / opl 
%EDX <- %EDX%EAX % opl 


opl: mem. o reg. 
(Enteros) 


IDIVL (%EBX) 


DIVL opl 


%EAX <r- %EDX%EAX / opl 
%EDX <- %EDX%EAX % opl 


opl: mem. o reg. 
(Naturales) 


DIVL %ESI 



Instrucciones 



■ Lógicas 



Instrucciones 


Descripción 




Ejemplo 


ANDx opl, op2 


op2 <- op2&opl 


x = {L, W, B} 


ANDLSlS^/oEAX 


ORx opl, op2 


op2 <- op2|opl 


x = {L, W, B} 


ORW %CX,%AX 


XORx opl, op2 


op2 <- op2 A opl 


x = {L, W, B} 


XORL%EDX ; °/oEAX 


NOTx opl 


opl <— ~opl 


x = {L, W, B} 


NOTB %AH 


SALx k,opl 


opl <- opl«k (aritm.) 


x = {L, W, B}, k 


inm. o %CL 


SALL #1,%EAX 


SHLx k,opl 


opl <- opl«k (log.) 


x = {L, W, B}, k 


inm. o %CL 


SHLW #CL,%DX 


SARx k,opl 


opl <— opl»k (aritm.) 


x = {L, W, B}, k 


inm. o %CL 


SARL #1,%EAX 


SHRx k,opl 


opl <- opl»k (log.) 


x = {L, W, B}, k 


inm. o %CL 


SHRW #CL,%DX 


CMPx opl, op2 


op2-opl 


x = {L, W, B}, activa flags 


CMPL$13 ; %EAX 


TESTx opl, op2 


op2&opl 


x = {L, W, B}, activa flags 


TESTW %CX,%AX 




Instrucciones 



■ Secuenciamiento 



Instrucciones 


Descripción 




Ejemplo 


JMP etiq 


EIP <— ElP+despl. 


EIP <- &etiq 


JMP loop 


JMPop 


EIP^op 


op: reg. o mem. 


JMP (%ebx,%es¡,4) 


Jcc etiq 


if (ce) EIP <- ElP+despl. 


CC = {E, NE, G, GE, L, LE, ...} (Z) 


JLE else 


Jcc etiq 


¡f (ce) EIP <- ElP+despl. 


ce = {A, AE, B, BE, ...} (N) 


JA loop 


Jcc etiq 


¡f (ce) EIP <— ElP+despl. 


ce = [I, NZ, C, NC, 0, ...} (flags) 


JNC error 


CALL etiq 


%ESP <- %ESP-4 

M[%ESP] <r- EIP 

EIP <— ElP+despl. 


Guardar @retorno 
EIP <- &etiq 


CALL sub 


CALL op 


%ESP <- %ESP-4 
M[%ESP] <- EIP 
EIP^op 


op: reg. o mem. 


CALL (%EBX) 


RET 


EIP+-M[%ESP]; 
%ESP <- %ESP+4 




RET 



c 


ódigos 


de condición 


(FLAGS) 





■ Se activan implícitamente después de ejecutar cualquier instrucción aritmética 

■ Se almacenan en un registro (32 bits) especial del procesador: EFLAGS 

ADDL opl, op2 ; op2 <- op2 + opl 

• CF (Carry Flag): Carry de la suma del bit 31. Overflow en unsigned 

• ZF (Zero Flag): ZF = 1 si t == O 

• SF(Sign Flag): SF = 1 si t < O 

• OF (Overflow Flag): OF = 1 si (a>0 && b>0 && t<0) | | (a<0 && b<0 && t>0) 

CMPL opl, op2 ; op2 - opl, y se activan los flags sin guardar el resultado de la resta 

• CF (Carry Flag): Carry (borrow) de la resta del bit más significativo 

• ZF (Zero Flag): ZF = 1 si a == b 

• SF (Sign Flag): SF = 1 si (a - b) < O (=> a<b) 

• OF (Overflow Flag): OF = 1 si (a>0 && b<0 && (a-b)<0) 1 1 (a<0 && b>0 && (a-b)>0) 




Instrucciones 



■ Secuenciamiento 







JE etiq 


ZF 


Igual / cero 


JNEetiq 


~ZF 


No igual / no cero 


JS etiq 


SF 


Negativo 


JNS etiq 


~SF 


No negativo 


JG etiq 


~(SF A OF)&~ZF 


Mayor (con signo) 


JGE etiq 


~(SF*OF) 


Mayor o igual (con signo) 


JL etiq 


(SF*OF) 


Menor (con signo) 


JLE etic 


(SF A OF)|ZF 


Menor o igual (con signo) 


JA etiq 


~CF&~ZF 


Mayor (sin signo) 


JAE etiq 


~CF 


Menor o igual (sin signo) 


JB etiq 


CF 


Menor (sin signo) 


JBE etiq 


CF A ZF 


Menor o igual (sin signo) 



Códigos de condición (FLAGS) 



■ Ejemplos 



Instrucciones 


OF 


DF 


IF 


TF 


SF 










ADD opl, op2 


X 








X 


X 


X 


X 


X 


AND opl, op2 


0 








X 


X 


? 


X 


0 


DEC opl 


X 








X 


X 


X 


X 




NOT opl 




















STC 


















1 


MOV opl, op2 




















MULopl 


X 








? 


? 


? 


? 


X 


SAL k,opl 


i 








X 


X 


? 


X 


X 


LEAL opl, op2 





















■ Para más detalles, ¡consultad el manual! 




Ejemplo ensamblador 



■ Convertir 'abe...' en 'ABC...' 



. data 




.align 4 




v: .string "Esto es una frase 


. salto de linea. \n" 


.text 




.align 4 




.globl main 




.type main, @funct ion 
main: 




xorl %esi,%esi 


esi <- 0 


moví $v, %ebx 


ebx <— @inicio v 


do: movb (%ebx, %esi) , %al 


al<-v[i] 


empb $' a' , %al 




jl cont 


¿v[i] < 'a'? 


empb $' z' , %al 




jg cont 


¿v[i] > 'z'? 


¡ ndi > ?0xDF ' sebx les; 


_jr[i] <-MAY(v[i]) 


cont: inel %esi 




empb $'\n', (%ebx,%esi) 




jne do 


¿v[i] == 'Xn'? 


end: 





Ejemplo ensamblador 

■ A¡ <— A¡ / B¡ , A y B vectores de enteros acabados en 0 



. data 




.align 4 




A: .int 34, 45, 12, 56, -67, 0 


B: .int -4, 6, 91, 12, 4, 0 




.text 




.align 4 




.globl main 




.type main, @funct ion 




xorl %ecx,%ecx 


ecx <- 0 


leal A, %edi 


edi <— @inicio A 


moví $B, %esi 


esi <— @inicio B 


do: moví (%edi, %ecx, 4) , %eax 


eax <— A [i] 


cltd 


edx <— ExtSign (eax) 


idivl (%esi, %ecx, 4) 


eax <— edxeax / B [ i ] 


moví %eax, (%edi, %ecx, 4) 


A [i] <— eax 


inel %esi 


i++ 


cmpl $0, (%esi, %ecx, 4) 




jne do 


¿B[i] == 0? 


end: 
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■ Sentencia CONDICIONAL (IF-THEN-ELSE) 



Modelo: 




Traducción genérica: 


if (cond) 




evaluar condición 


CUERPO-IF 




j (no cumple) else 


else 




if: CUERPO-IF 


CUERPO-ELSE 




jmp endif 






else : CUERPO— ELSE 




endif : 



Ejemplo: 



int max(int x, int y) { 
int max; 

if (x>y) max = x; 

else max = y; 
return max; 




Traducción de sentencias C a ensamblador 



■ Sentencia CONDICIONAL (IF-THEN-ELSE) 



Ejemplo: 

: int max (int x, int y) { 
int max; 

if (x>y) max = x; 
else max = y; 

return max; 



Traducción: 

max : pushl %ebp 

moví %esp, %ebp 
moví 8 (%ebp) , %ecx 
moví 12 (%ebp) , %edx 
cmpl %edx, %ecx 
jle else 

if : moví %ecx, %eax 
jmp endif 

else: moví %edx, %eax 

endif : popí %ebp 
ret 



# x->8[%ebp] 

# y->12[%ebp] 

# resultado en %eax 



Trariurrinn 
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Sentencia ITERATIVA (DO-WHILE) 



Modelo: 
do 

CUERPO-DO 
while (cond) 



Traducción genérica: 
do 



CUERPO-DO 
evaluar condición 
j (cumple) do 



end: 



Ejemplo: 




int ContA(char 


v[]) { 


int i , cont ; 




cont = 0 ; 




i = 0; 




do { 




if (v[i] == 


= 'a') cont++; 


i++; 




} while (v[i 


!= "■'); 


return cont; 

} 





Traducción 


de ¡ 


sentencias 


Ca 


ensamblador 



Sentencia ITERATIVA (DO-WHILE) 



Ejemplo: 






int ContA(char 


v[]) 


{ 


int i , cont ; 






cont = 0 ; 






i = 0; 






do { 






if (v[i] == 




cont++; 


i++; 






} while (v[i] 


! = ' 


.'); 


return cont; 

} 







Traducción: 




Cont A: 


pushl %ebp 






moví %esp, 


%ebp 




moví 8 (%ebp) , %ecx 




xorl %eax, 


%eax 




xorl %edx, %edx 


do: 


cmpb $' a' , 


(%ecx, %edx) 




jne endif 






incl %eax; 




endif : 


incl %edx 






cmpb $ ' . ' , 


(%ecx, %edx) 




jne do 




end: 


popí %ebp 






ret 




# @v->8[%ebp] 





Trariurrinn 
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■ Sentencia ITERATIVA (WHILE) 



Modelo: 

while (cond) { 
CUERPO-WHILE 

} 



Ejemplo: 

int gcd(int a, int b) { 
while (b!=0) { 

if (a>b) a = a-b; 
else b = b-a; 

} 

return a; 




Traducción genérica: 

while : evaluar condición 
j (no cumple) end 

CUERPO-WHILE 
jmp while 



Traducción 


de ¡ 


sentencias 


Ca 


ensamblador 



Sentencia ITERATIVA (WHILE) 



Ejemplo: 




int gcd(int a, 


int b) { 


while (b!=0) 


{ 


if (a>b) a 


= a-b; 


else b 


= b-a; 


} 

return a; 

} 





Traducción: 




gcd: 


pushl %ebp 






moví %esp, 


%ebp 




moví 8 (%ebp) , %eax 




moví 12 (%ebp) , %ecx 


while : 


cmpl $0,%ecx 




je end 






cmpl %ecx, - 


seax 




jle else 






subí %ecx, - 


seax 




jmp endif 




else : 


subí %eax, £ 


becx 


endif : 


jmp while 




end: 


popí %ebp 






ret 




# a-> 


3[%ebp] 




# b->12[%ebp] 





Trariurrinn 
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■ Sentencia ITERATIVA (WHILE) 



Ejemplo: 




Traducción: 






gcd : pushl %ebp 


int gcd(int a, int b) { 




moví %esp, %ebp 


int t; 




moví 8 (%ebp) , %eax 


while (b!=0) { 




moví 12 (%ebp) , %ecx 


t = b; 




while: cmpl $0,%ecx 


b = a%b; 




je end 


a = t; 




pushl %ecx 


} 




cltd 


return a; 




idivl %ecx 


} 




moví %edx, %ecx 




popí %eax 




jmp while 




end: 




ret 




# a->8[%ebp] 




# b->12[%ebp] 
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■ Sentencia ITERATIVA (FOR) 



Modelo: 

for(INI; COND; INC) { 
CUERPO-FOR 

} 



Ejemplo: 

int sumV(int V[], int N) { 
int sum, i; 
sum = 0; 

for (i=0; i<N; i++) 
sum = sum + V[i] ; 
return sum; 




Traducción genérica: 

INI 

for : evaluar condición 
j (no cumple) end 

CUERPO-FOR 
INC 

jmp for 
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■ Sentencia ITERATIVA (FOR) 



Ejemplo: 




Traducción: 






sumV: pushl %ebp 


int sumV(int V[], int N) { 




moví %esp, %ebp 


int sum, i ; 




moví 8 (%ebp) , %edx 


sum = 0; 




xorl %eax, %eax 


for (i=0; i<N; i++) 




xorl %ecx,%ecx 


sum = sum + V[i] ; 




for: cmpl 12 (%ebp) , %ecx 


return sum; 




jge end 


} 




addl (%edx, %ecx, 4) , %eax 




incl %ecx 




jmp for 




end: popí %ebp 




ret 




# @V->8[%ebp] 




# N->12[%ebp] 
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Sentencia CONDICIONAL (switch) 



Ejemplo: 



s wi t ch_eg (int x ) 



int result 
switch (x) 

case 100 

case 102 

case 103 

case 104 

case 106 

def ault : 
} 

return result; 



= x; 
{ 

result *= 
result += 
result += 



Implementación con una serie de 
condicionales (tipo if ): 

• Funciona bien en algunos cosos 

• Muy lento en la mayoría 



break; 
break; 



result *=result; break; 
result = 0; 



Implementación con vector de 
punteros: 

• Más eficiente en general 



Traducción de sentencias C a ensamblador 



Sentencia CONDICIONAL (switch) 



Ejemplo: 






void S(int x) 




{ 

int result = x; 




switch (x) { 




case 100 


result 


*= 13; break; 


case 102 


result 


+= 10; 


case 103 


result 


+= 11; break; 


case 104 






case 106 


result 


*=result; break; 


def ault : 


result = 


= 0; 


i 

return result; 

} 





Traducción con IFs: 

S: pushl %ebp 

moví %esp, %ebp 
moví 8 (%ebp) , %eax 
cmpl $100,%eax 
jne C102 

imull $13, %eax, %eax 
jmp end 

cmpl $102,%eax 
jne C103 
addl $10,%eax 
addl $ll,%eax 
jmp end 

cmpl $103,%eax 
je L103 

cmpl $104,%eax 
je L106 

cmpl $106,%eax 
jne default 
imull %eax, %eax 
jmp end 

xorl %eax, %eax 

popí %ebp 
ret 



L100 



C102 



L102 
L103 



C103 



L106 



Traducción de sentencias C a ensamblador 



Sentencia CONDICIONAL (switch) 



Ejemplo: 



void S(int x) 



= x; 
{ 

result 
result += 
result 



int result 
switch (x) 

case 100 

case 102 

case 103 

case 104 

case 106 

default : result = 0 

} 

return result; 



Traducción con Vector de punteros (pseudoC): 

code *JT[7] = {L100,LDEF,L102,L103,L104,LDEF,L106}; 



xi = x - 100; 

if ( (x<100) | | (x>106) ) jmp LDEF; 
goto JT[x-100] ; 

L100: {código para x==100}; goto DONE 

L102: {código para x==102}; 

L103: {código para x==103}; goto DONE 

L104: 

L106: {código para x==106}; goto DONE 
LDEF: {código para default}; 
DONE : return result ; 
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Sentencia CONDICIONAL (switch) 



Ejemplo: 








void S(int x) 






{ 

int result = x; 






switch (x) { 






case 100 


result 


*= 13; 


break 


case 102 


result 


+= 10; 




case 103 


result 


+= 11; 


break 


case 104 








case 106 


result 


*=result; br 


def ault : 


result = 


= 0; 




i 

return result; 

} 







Traducción con Vector de punteros : 

.section .rodata 
.align 4 

LT: .long LO, LD, L2, L3, L46, LD, L46 

S: pushl %ebp 

moví %esp, %ebp 
moví 8 (%ebp) , %eax 
cmpl $100,%eax 
jl LD 

cmpl $106,%eax 
jg LD 

leal -100 (%eax) , %edx 
jmp LT (, %edx, 4) 
LO: imull $13,%eax # case 100 

jmp end 

L2: addl $10,%eax # case 102 

L3: addl $ll,%eax # case 103 

jmp end 

L46: imull %edx, %edx # case 104,106 
jmp end 

LD : xorl %eax, %eax # def ault 

end : popí %ebp 
ret 



Tipos de datos estructurados 

Vectores 

■ Declaración en C: 

tipo nombre [tamaño] ; //indexado a partir de 0 

■ Almacenamiento en posiciones consecutivas de memoria 

• Acceso elemento V[¡]: @inicio V + ¡'tam (tam: tamaño de los elementos de V) 



Ejemplos: 


Declaración en C 


Tamaño 
elemento 


Tamaño 
vector 


@elemento i 


char A [12] ; 


1B 


12B 


@inicio A+ i 


char *B[80] ; 


4B 


320B 


@inicio B + 4-i 


double C[1024]; 


8B 


8KB 


@inicio C + 8-i 


int *D [5] ; 


4B 


20B 


@inicio D + 4-i 


int E[100] ; 


4B 


400B 


@inicio E + 4-i 
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de 
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■ Vectores 



Ejemplo: 

int Vi(int V[100], int i) { 
return V[i] ; 



Traducción: 






Vi : pushl %ebp 






moví %esp, %ebp 






moví 8 (%ebp) , %ecx 


# 


@V-> 8 [%ebp] 


moví 12 (%ebp) , %edx 


# 


i -> 12 [%ebp] 


moví (%ecx, %edx, 4) , 


seax 


popí %ebp 


# 


resultado en %eax 


ret 








Tipos de datos estructurados 

Matrices 

■ Declaración en C: 

tipo nombre [NumFilas] [NumColumnas] ; //indexado a partir de (0,0) 

■ Almacenamiento por filas en posiciones consecutivas de memoria 

■ Acceso elemento A[i][j]: @inicio A + (i-NumColumanas + j)-tam (tam: tamaño de los elementos de V) 

■ Ejemplos: 



Declaración en C 


Tamaño 
elemento 


Tamaño 
matriz 


©elemento (i, j) 


char A[80] [25] ; 


1B 


2000B 


@inicio A+ i-25 + j 


char *B[80] [10] ; 


4B 


3200B 


@inicio B + (i-10 + j) ■ 4 


double C[1024] [100] ; 


8B 


800KB 


@inicio C + (i-100 + j) ■ 8 


int *D[5] [90] ; 


4B 


1800B 


@inicio D + (i-90 + j) ■ 4 


int E[100] [30] ; 


4B 


12000B 


@inicio E + (i-30 + j) ■ 4 




TinoQ 


de 


Hatnc 
ua iuj 


pctri irti iraHnc 





Matrices 3-dimensiones 

■ Ejemplo, matriz de enteros de 3 dimensiones: 

int M3D[10] [64] [48] ; // cada int ocupa 4 bytes 



■ La matriz se almacena en posiciones consecutivas de memoria: cara a cara y en cada 
cara por filas. 

■ Acceso al elemento M3D [cara] [fila] [columna] : 

• @inicio M3D + (cara -64 -48 + fila -48 + columna) -4 

■ Es fácil deducir como se almacenan / accede a matrices de N-dimensiones. 




Tipos de datos estructurados 



■ Matrices 



Ejemplo: 

int Mfc(int M[50] [80] , int fil, int col) { 
return M[fil] [col] ; 



Traducción: 




Mf c : pushl %ebp 




moví %esp, %ebp 




moví 8(%ebp),%ecx # 


@M-> 8 [%ebp] 


moví 12 (%ebp) , %edx # 


fil->12[%ebp] 


imull $80, %edx , %eax 




addl 16(%ebp) , %eax # 


col -> 16 [%ebp] 


moví (%ecx, %eax, 4) , %eax 


popí %ebp # 


resultado en %eax 




TinoQ 
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Ejemplo: 

void Copia(int M[50] [80], 
int i, j; 

for (i=0; i<50; i++) 
for (j=0; j<80; j++) 
M[i] [j] = X[i] [j]; 

} 



int X[50] [80] ) { 



Tipos 


de 


datos 


estructurados 





Traducción: 

Copia 



pushl %ebp 
moví %esp, %ebp 
moví 8 (%ebp) , %edi 
moví 12 (%ebp) , %esi 
salvar reg 
xorl %ecx, %ecx 
cmpl $50, %ecx 
jge endi 
cuerpo-FORi 
incl %ecx 
jmp fori 
restaurar reg 
popí %ebp 
ret 



■ %ecx 
%edx 

->8[%ebp] 
->12[%ebp] 



#cuerpo-FORi : 

xorl %edx, %edx 
forj: cmpl $80, %edx 

jge endforj 

cuerpo-FORj 

incl %edx 

jmp forj 



end j : 



Instrucciones ejecutadas: 13 + 50 (7 + 80-8) = 32.265 



#cuerpo-FORj : 
imull $80, %ecx, %eax 
addl %edx, %eax 
moví (%esi, %eax, 4) , %ebx 
moví %ebx, (%edi, %eax, 4) 
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Matrices 



Optimización: 

Copia : pushl %ebp 

moví %esp, %ebp 

moví 8(%ebp),%edi # @M 

moví 12 (%ebp) , %esi # @X 

salvar reg 

xorl %ecx,%ecx 
loop: moví (%esi, %ecx, 4) , %eax 

moví %eax, (%edi, %ecx, 4) 

inel %ecx 

cmpl $4000, %ecx 

jl loop 

restaurar reg 

popí %ebp 



Objetivo: reducir el número 
de instrucciones. 
• Se puede ver la matriz como un 
vector de 4000 posiciones. 



► 8 [%ebp] 
> 12 [%ebp] 



Instrucciones ejecutadas: 11 + 4000-5 = 20.011 



Tipos de datos estructurados 



Matrices 



Objetivo: reducir el número 



Optimización: Desenrollar de instrucciones. 

Copia : pushl %ebp * El bucle se ejecuta 1/2 de 

moví %esp, %ebp veces 

moví 8 (%ebp) , %edi # @M->8[%ebp] 
moví 12 (%ebp) , %esi # @X ->12[%ebp] 

xorl %ecx,%ecx 
loop: moví (%esi, %ecx, 4) , %eax 
moví %eax, (%edi, %ecx, 4) 
moví 4 (%esi, %ecx, 4) , %eax 
moví %eax , 4 ( %edi , %ecx , 4 ) 
addl $2,%ecx 
cmpl $4000, %ecx 
jl loop 
restaurar reg 
popí %ebp 
ret 



Instrucciones ejecutadas: 11 + 2000-7 = 14.011 
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■ Instrucciones SIMD (Single Instruction Múltiple Data 


Objetivo: reducir el número 

de instrucciones. 

• El bucle se ejecuta 1/4 de 

veces y además tiene menos 

instrucciones 


Optimización: Desenrollar 4 + SIMD 

Copia : pushl %ebp 

moví %esp, %ebp 

moví 8(%ebp),%edi # @M->8[%ebp] 


moví 12 (%ebp) , %esi 
salvar reg 
xorl %ecx,%ecx 
loop: movdqa (%esi,%ecx, 
movdqa %xmmO, (%edi 
addl $4,%ecx 
cmpl $4000, %ecx 
jl loop 

popí %ebp 
ret 


# @X ->12[%ebp] 

4) , %xmm0 
, %ecx, 4) 






movdqa : mov double quadword (128 bits) aligned 
(dirección de inicio de X y M debe ser múltiplo de 16) 
(existe movdqu u=unaligned pero es menos eficiente) 

%xmm0: registro de 128 bits para las extensiones SSE 
(en 128 bits podemos almacenar 4 enteros) 





Instrucciones ejecutadas: 11 + 1000-5 = 5.011 



Instrucciones SIMD 



■ Extensiones del lenguaje máquina: 

• ¡8086(1977) 



16 




Instrucciones SIMD 



Extensiones del lenguaje máquina: 

• ¡8086 (1977), ¡8087 (1980) 



i 



Coprocesador de coma flotante: simple precisión (32 
bits) doble precisión (64 bits), precisión extendida (80 
bits). Añade 60 instrucciones. Híbrido entre un banco 
de registros de propósito general y máquina de pila 
(register stack). 



Instrucciones SIMD 



Extensiones del lenguaje máquina: 

• ¡8086 (1977), ¡8087 (1980), IA-32 (1985) 

32 80 



I 



%st1 
%st2 
%St3 
%St4 
%st5 
%st6 
%St7 



El ¡80386 extiende la arquitectura a 32 bits (IA-32). Se 
añaden modos de direccionamiento e instrucciones. 
La extensión IA-32 es una máquina de registros de 
propósito general (con alguna excepción). 




Instrucciones SIMD 



Extensiones del lenguaje máquina: 

• ¡8086 (1977), ¡8087 (1980), IA-32 (1985), MMX (1997) 



%eax I 

%ebx I 

%ecx I 

%edx I 
%esi 

%edi I 

%ebp I 

%esp | 



64 






%StO 
%St1 


%mmx0 
%mmx1 


%St2 


%mmx2 


%St3 


%mmx3 


%St4 


%mmx4 


%St5 


%mmx5 


%St6 
%St7 


%mmx6 
%mmx7 



Instrucciones SIMD de 64 bits para enteros (8x8, 
4x16, 2x32). Los registros %mmx están mapeados 
sobre los registros de punto flotante (sobre los 64 bits 
de mantisa) 




Instrucciones SIMD 



Extensiones del lenguaje máquina: 

• ¡8086 (1977), ¡8087 (1980), IA-32 (1985), MMX (1997), SSE (1999) 



%eax I 

%ebx I 

%ecx I 

%esi I 

%edi I 

%ebp I 

%esp | 



%st6 
%st7 



%mmx6 
%mmx7 



%xmm6 
%xmm7 



Nuevas instrucciones SIMD de 128 bits para enteros 
(16x8,8x16,4x32,2x64) y punto flotante (4x32,2x64). Usan 
un banco de registros separado. Se han ido incorporando 
nuevas instrucciones en distintas generaciones: SSE, SSE2, 
SSE3, SSSE3, SSE4 (4.1, 4.2, 4a), 



Instrucciones SIMD 



■ Extensiones del lenguaje máquina: 

• ¡8086 (1977), ¡8087 (1980), IA-32 (1985), MMX (1997), SSE (1999), AMD-64 (2003) 

^ 64 ^ ^ 80 ^ 128 ^ 



%rax 
%rbx 


%eax 
%ebx 






%St0 
%St1 


%mmx0 
%mmx1 




%xmm0 
%xmm1 


%rcx 


%ecx 






%St2 


%mmx2 




%xmm2 


%rdx 


%edx 


1 




%st3 


%mmx3 




%xmm3 


%rsi 








%St4 


%mmx4 




%xmm4 


%rd¡ 


%ed¡ 






%St5 


%mmx5 




%xmm5 


%rbp 


%ebp 






%St6 
%St7 


%mmx6 
%mmx7 




%xmm6 
%xmm7 


%rsp 
%r8 












%xmm8 


%r9 










%xmm9 


%r10 










%xmm10 


%r11 


Extensión a 64 bits (por AMD). Los registros de 


m11 


%r1 2 


m12 


%r13 


propósito general aumentan a 64 bits y se aumenta 


m13 


%r1 4 


su número a 16. También se aumenta a 16 los 


m14 


%r15 


registros %xmm 








m15 













Instrucciones SIMD 



■ Ejemplo: paddb %xmmi, %xmm3 # add packed byte integers 



%xmml 0 
%xmm3 




Instrucciones 


Descripción 




PADDB 


add packed byte integers 


16x8bits 


PADDW 


add packed word integers 


8xl6bits 


PADDD 


add packed doubleword integers 


4x32bits 


PADDQ 


add packed quadword integers 


2x64bits 


ADDPS 


add packed single-precission floating-point valúes 


4x32 bits 


ADDPD 


add packed double-precission floating-point valúes 


2x64bits 











Instrucciones SIMD 



Ejemplo: Calcular el vector máximo de 2 vectores de caracteres 



void maxv(char a[], b[], max[]) 
int i; 

for (i=0;i<8000;i++) { 

if (a[i]>b[i]) max[i]=a[i]; 
else max [i] =b [i] ; 

E > 
} 



for: cmpl $8000, %esi 
jge fin 

movdqa (%ebx, %esi) , %xmm0 
pmaxsb (%ecx, %esi) , %xmm0 
movdqa %xmm0, (%edx, %esi) 
addl $16, %esi 
jmp for 



9 instrucciones cada iteración 



7 instrucciones cada 16 iteraciones 





pushl %ebp 






moví %esp, %ebp 






; Salvar Registros 






moví 8 (%ebp) , %ebx 






moví 12 (%ebp) , %ecx 


ebx <- @b 




moví 16 (%ebp) , %edx 


edx <— @max 




xorl %esi,%esi 


i^0 


for: 


cmpl $8000, %esi 


i < 8000 




jge fin 






movb (%ebx, %esi) , %al 


al<-a[i] 




cmpb (%ecx, %esi) , %al 


a[i] > b[i] 




jle else 






movb %al, (%edx, %esi) ; max[i]<— a[i] 




jmp cont 




else : 


movb (%ecx, %esi) , %al 






movb %al, (%edx, %esi) 


max [i] <— b [i] 


cont : 


incl %esi 


i++ 




jmp for 






; Restaurar Registros 






popí %ebp 






ret 





Tipos de datos estructurados 



Estructuras (struct) 

• conjunto heterogéneo de datos 

■S almacenados de forma contigua en memoria 
■S referenciados por su nombre 



Ejemplo: 

typedef struct { 

int i; 

int a [3] ; 

int *p ; 
} X; 
X S; 



Init (&S) ; 



i 




a[0] 




a[l] 


a[2] 


P 





-+o 

-+4 



*S) { 



Ejemplo: 
void Init (X 

(*S) .i = 1; 

S->a[2] = 0; 

S->p = & (*S) .a[0] ; 

} 
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Estructuras (struct) 



Ejemplo: 

typedef struct { 

int i; 

int a [3] ; 

int *p; 
} X; 
X S; 

Init (&S) ; 



Traducción: 




Init : push 


%ebp 


moví 


%esp, %ebp 


moví 


$1, (%edx) 


moví 


$0, 12 (%edx) 


leal 


4 (%edx) , %eax 


moví 

popí 


%eax,16(%edx) 



i 




a[0] 




a[l] 


a[2] 


P 





-+o 

-+4 



Ejemplo: 

void Init (X *S) { 
(*S) .i = 1; 
S->a[2] = 0; 
S->p = & (*S) .a[0] ; 

} 



Alineamiento de datos 



Alineamiento de datos 

• Un tipo de dato primitivo requiere k bytes 

■S La dirección debe ser múltiplo de k 

V En algunas máquinas es obligatorio. Aconsejable en IA32 

S Trato distinto en Windows y Linux 

Motivación para alinear datos 

• Accesos a memoria por longword o quadwords alineados 

• Accesos no alineados pueden provocar que un mismo dato se encuentre en 2 líneas de 
cache diferentes. 

• Memoria virtual: problemas si el dato está entre dos páginas 

Compilador 

• Inserta "espacios" en la estructura para asegurar que los datos están alineados. 



Alineamiento de datos 



■ Alineamiento en linux-32 (gcc): 

• char (1 byte): alineado a 1-byte (no hay restricciones en la @) 

• short (2 bytes): alineado a 2-bytes (el bit más bajo de la @ debe ser 0 

• int (4 bytes): alineado a 4-bytes (los 2 bits más bajos de la @ deben ser 00) 

• puntero (4 bytes): alineado a 4-bytes 

• double (8 bytes): alineado a 4-bytes 

• long double (12 bytes): alineado a 4-bytes 

■ Diferencias linux-64: 

• double (8 bytes): alineado a 8-bytes. 

• long double (16 bytes): alineado a 16-bytes. 

• puntero (8 bytes): alineado a 8-bytes. 

■ Diferencias windows-32: 

• double (8 bytes): alineado a 8-bytes. 

• long double (10 bytes): alineado a 2-bytes 




Alineamiento 


de 


i datos 







■ Offsets dentro de una estructura: 

• deben satisfacer los requerimientos de alineamiento de sus elementos 

■ Dirección de la estructura 

• Cada estructura tiene un requerimiento de alineamiento k (el mayor de los 
alineamientos de cualquier elemento) 

• La @ inicial de la estructura debe ser múltiplo de k 

Ejemplo: 

struct SI { 
char c; 
int i [2] ; 
double v; 

}*p; 



• (Linux-32) k = 4 

• (Linux-64) k = 8 debido al elemento double 
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Ejemplo (Linux-64) k = 8 debido al elemento double 

-p + 0 



Ejemplo: 
struct SI { 

char c; 

int i [2]; 

double v; 

}*p; 



-p + 4« 



lile 




i[0] 


* 


i[l] 


1 1 1 




" 



-p + 0 
-p + 4W 



-p + 16< 2 > 



¡La dirección de inicio de la 
estructura ha de ser múltiplo de 8! 



-p + 16< 2 > 



(1) Múltiplo de 4 

(2) Múltiplo de 8 
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Ejemplo (Linux-32) k = 4 debido a que el elemento double se trata a nivel de alineamiento 
como un elemento de 4 bytes. 



Ejemplo: 
struct SI { 

char c; 

int i [2] ; 

double v; 

}*p; 



-p + o 



lile 




i[0] 


4 — 


i[l] 


V 


« — 



-p + 0 
-p + 4(D 



¡La dirección de inicio de la 
estructura ha de ser múltiplo de 4! 



(1) Múltiplo de 4 



Alineamiento de datos 



El orden de los elementos de una estructura influye en su tamaño. 

• Ejemplo en Unux-64 



struct S4 { 
char el; 
double v; 
char c2 ; 
int i; 

} *p; 



struct S5 { 
double v; 
char el; 
char c2 ; 
int i; 

} *p; 



el 


" 




V 




1 1 |c2 





i 


" 



p + 0 

p + 8< 2 > 

p + 16 
p + 20^ 



V 




1 | c2 | el 


4 


i 


' 



-p + 0 

-p + 8 
-P + 12W 



(1) Múltiplo de 4 

(2) Múltiplo de 8 



¡La dirección de inicio de la 
estructura ha de ser múltiplo de 8! 



Alineamiento de datos 



El orden de los elementos de una estructura influye en su tamaño. 



struct S4 { 
char el; 
double v; 
char c2 ; 
int i; 

} *p; 



struct S5 { 
double v; 
char el ; 
char c2 ; 
int i; 

} *p; 



• El programador de C puede reordenar los elementos de la estructura para minimizar el 
espacio ocupado. 



• Sin embargo, el programador de ensamblador NO puede realizar esta optimización cuando 
enlaza ensamblador con C. 
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■ Subrutina: Conjunto de instrucciones de LM que realiza una tarea específica y que 
puede ser activada (llamada) desde cualquier punto de un programa o desde la 
propia subrutina 

■ Activación interna: la llamada se hace desde la propia subrutina 

■ Activación externa: la llamada se hace desde el programa principal o desde otra 
subrutina 

■ Entre el 5 y el 10% de las instrucciones que ejecuta un procesador son llamadas o 
retornos de subrutinas. 

■ Clasificación de las subrutinas 

• Uninivel 

• Multinivel 

• Recursivas 

• Reentrantes 

• No reentrantes 
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Ventajas del uso de subrutinas 

• El código ocupa menos espacio en memoria 

• El código está más estructurado 

S facilidad de depuración 

S facilidad de expansión o modificación 

S posibilidad de usar librerías públicas 

• El LM refleja la idea fundamental de los lenguajes estructurados de alto nivel: la 
existencia de funciones y procedimientos 

Inconvenientes del uso de subrutinas 

• El tiempo de ejecución de los programas aumenta debido a: 

S la ejecución de las instrucciones de llamada y retorno de subrutina 
S el paso de parámetros 

• La complejidad del procesador es mayor porque debe añadirse hardware 
específico para la gestión eficiente de subrutinas 



Gestión 


de 


subrutina 


s 





Terminología 

• Parámetros 

^Valor 
^Referencia 

• Variables locales 

• Invocación 

• Retorno resultado 

• Cuerpo subrutina 



int DOT(int vi [ ] , int v2[], ) { 

int i, sum; 
sum = 0; 

for (i=0; i<N; i++) 

sum += vi [i] * v2[i]; 
return sum; 

} 

void PDOT(int M[10] [10] , int *p) { 
int i ; 
*P = 0; 

for (i=0; i<10; i++) 

*p += DOT(&M[0] [0] ,&M[i] [0] ,10) ; 

} 
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■ Convenciones en C-Linux 32 bits 

• Los parámetros se pasan por la pila de derecha a izquierda 

• Los vectores y matrices siempre se pasan por referencia 

• Los structs se pueden pasar por valor, no importa el tamaño 

• Los parámetros de tipo carácter (1 byte) ocupan 4 bytes 

• Los parámetros de tipo short (2 bytes) ocupan 4 bytes 

• Las variables locales están alineadas en la pila con la misma convención que 
dentro de un struc 

S Charen cualquier dirección 

S Short en direcciones múltiplos de 2 

S Integer en direcciones múltiplos de 4 

• Los registros %ebp, %esp se salvan siempre implícitamente en la gestión de 
subrutinas 

• Los registros %ebx, %esi, %edi se han de salvar si son modificados 

• Los registros %eax, %ecx, %edx se pueden modificar en el interior de una 
subrutina. Si es necesario, el LLAMADOR ha de salvarlos 

• Los resultados se devuelven siempre en %eax 
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■ Bloque activación 

void PDOT(int M[10][10], int *p) { 
• PILA int i; 

*p = 0; 

for (i=0; i<10; i++) 

*p += DOT(&M[0] [0] ,&M[i] [0] , 10) ; 

} 

{código llamador PDOT} 
empilar parámetros PDOT 
cali PDOT 



PDOT: pushl %ebp 

moví %esp, %ebp 
subí $4, %esp 
salvar registros 




Bloque de 
Activación < 
de PDOT 



+8 
+12 



VJC31IUI 1 


de 
uc 


ihri itinac 

JUUI U III 1 Cid 





1. Paso de parámetros 



oid PDOT(int M[10][10], int *p) { 
*p = Ó; 

for (i=0; i<10; i++) 

*p += DOT(&M[0] [0] ,&M[i] [0] ,10) ; 



pushl $10 

imull $10,-4 (%ebp) , %edx 
moví 8 (%ebp) , %ebx 
leal (%ebx, %edx, 4) , %eax 
pushl %eax 
pushl %ebx 



Bloque de 
Activación < 
de PDOT 



@M[i] [0] 
10 



+8 
+12 



Gestión de Subrutinas 



2. Llamada a la subrutina 



oid PDOT(int M[10] [10], int *p) 



*p = 0; 

for (i=0; i<10; i++) 

*p += DOT(&Ml0J [0],&M[i] L 0 J , 1 0 ) ; 



pushl $10 

imull $10, -4 (%ebp) , %edx 

moví 8(%ebp),%ebx 

leal (%ebx, %edx, 4) , %eax 

pushl %eax 

pushl %ebx 

cali DOT 



Bloque de 
Activación < 
de PDOT 



@M[i] [0] 
10 



-%esp 



+8 
+12 
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2. Saltamos a la subrutina 

DOT: 



int DOT(int vl[], int v2[], int N) { 



sum = 0; 

for (i=0; i<N; i++) 

sum += vi [i] * v2 [i] ; 



- %esp 
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3. Enlace dinámico y puntero al bloque de activación 

DOT: pushl %ebp int DOT(int vl[], int v2[], int N) { 

moví %esp, %ebp int 1 ' sum; 

sum = 0; 

for (i=0; i<N; i++) 

sum += vi íil * v2[il ; 



-%ebp,%esp 



-+12 
-+16 



VJC31IUI 1 


de 
uc 


ihri itinac 

JUUI U III 1 CID 





4. Reserva espacio para variables locales 



DOT: pushl %ebp 

moví %esp, %ebp 
subí $8, %esp 



--8,%esp 

--4 

-%ebp 

-+8 
-+12 
-+16 
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5. Salvar estado del llamador 

DOT: pushl %ebp 

moví %esp, %ebp 
subí $8, %esp 
pushl %ebx 
pushl %esi 



sum = 0; 

for (i=0; i<N; i++) 

sum += vi [i] * v2[i]; 



Bloque de 
Activación \ 
de DOT 



--4 

-%ebp 



-+12 
-+16 
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de 
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6. Cuerpo subrutina 

DOT 



pushl %ebp 
moví %esp, %ebp 
subí $8, %esp 
pushl %ebx 
pushl %esi 
moví 8 (%ebp) , %ebx 
moví 12 (%ebp) , %esi 
moví $0,-4(%ebp) 
xorl %edx,%edx 
cmpl 16 (%ebp) , %edx 
jge end 

moví (%esi, %edx, 4) , %ecx 
imull (%ebx, %edx, 4) , %ecx 
addl %ecx,-4 (%ebp) 
incl %edx 
jmp for 



sum = 0; 

for (i=0; i<N; i++) 

sum += vi [i] * v2[i]; 



%esi 
%ebx 



Bloque de 
Activación \ 
de DOT 



--4 

-%ebp 



-+12 
-+16 
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7. Mover resultado a %eax 

DOT: pushl %ebp 

moví %esp, %ebp 

subí $8, %esp 

pushl %ebx 

pushl %esi 

moví 8(%ebp),%ebx 

moví 12 ( %ebp) , %esi 

moví $0,-4(%ebp) 



%edx 



cmpl 16 (%ebp) , %edx 
jge end 

moví (%esi, %edx, 4) , %ecx 
imull (%ebx, %edx, 4) , %ecx 
addl %ecx, -4 (%ebp) 
incl %edx 
jmp for 

moví , %eax 



Bloque de 
Activación \ 
de DOT 



--4 

-%ebp 



-+12 
-+16 
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de 
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8. Restaurar estado llamador 

DOT: pushl %ebp 

moví %esp, %ebp 

subí $8, %esp 

pushl %ebx 

pushl %esi 

moví 8(%ebp),%ebx 

moví 12 ( %ebp) , %esi 

moví $0,-4(%ebp) 



%edx 



cmpl 16 (%ebp) , %edx 
jge end 

moví (%esi, %edx, 4) , %ecx 
imull (%ebx, %edx, 4) , %ecx 
addl %ecx, -4 (%ebp) 
incl %edx 
jmp for 

moví -4 (%ebp) , %eax 
popí %esi 
popí %ebx 



Bloque de 
Activación \ 
de DOT 



--8,%esp 

--4 

-%ebp 

-+8 
-+12 
-+16 
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9. Eliminar variables locales 

DOT: pushl %ebp 

moví %esp, %ebp 

subí $8, %esp 

pushl %ebx 

pushl %esi 

moví 8(%ebp),%ebx 

moví 12 ( %ebp) , %esi 

moví $0,-4(%ebp) 



%edx 



cmpl 16 (%ebp) , %edx 
jge end 

moví (%esi, %edx, 4) , %ecx 
imull (%ebx, %edx, 4) , %ecx 
addl %ecx, -4 (%ebp) 



jmp for 

moví -4 (%ebp) , %e 
popí %esi 
popí %ebx 
moví %ebp, %esp 



Bloque de 
Activación \ 
de DOT 



-%ebp,%esp 



-+12 
-+16 
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10. Deshacer enlace dinámico 







pushl %ebp 
moví %esp, %ebp 
subí $8, %esp 
pushl %ebx 
pushl %esi 
moví 8(%ebp),%ebx 
moví 12 ( %ebp) , %esi 
moví $0,-4(%ebp) 



%edx 



cmpl 16 (%ebp) , %edx 
jge end 

moví (%esi, %edx, 4) , %ecx 
imull (%ebx, %edx, 4) , %ecx 
addl %ecx, -4 (%ebp) 
incl %edx 
jmp for 

moví -4 (%ebp) , %eax 
popí %esi 
popí %ebx 
moví %ebp, %esp 
popí %ebp 



Bloque de 
Activación \ 
de DOT 



- %esp 
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11. Retorno subrutina 



pushl %ebp 
moví %esp, %ebp 
subí $8, %esp 
pushl %ebx 
pushl %esi 
moví 8(%ebp),%ebx 
moví 12 ( %ebp) , %esi 
moví $0,-4(%ebp) 



%edx 



cmpl 16 (%ebp) , %edx 
jge end 

moví (%esi, %edx, 4) , %ecx 
imull (%ebx, %edx, 4) , %ecx 
addl %ecx, -4 (%ebp) 



jmp for 

moví -4 (%ebp) , %e 

popí %esi 

popí %ebx 

moví %ebp, %esp 

popí %ebp 

ret 



Bloque de 
Activación \ 
de DOT 
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11. Volvemos a la subrutina 



void PDOT(int M[10] [10], int *p) { 
*p = Ó; 

for (i=0; i<10; i++) 

*p += DOT(SM[0] [0] ,SM[i] [0] ,10) ; 



pushl $10 

imull $10, -4 (%ebp) , %edx 

moví 8(%ebp),%ebx 

leal (%ebx, %edx, 4) , %eax 

pushl %eax 

pushl %ebx 

cali DOT 



Bloque de 
Activación < 
de PDOT 



@M[i] [0] 
10 



- %esp 



+8 
+12 
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12. Eliminar parámetros 



void PDOT (int M L 10 J 110], int *p) 



*p = 0; 

for (i=0; i<10; i++) 

*p += DOT(&M[0] [0] ,&M[i] [0] ,10) ; 



pushl $10 

imull $10, -4 (%ebp) , %edx 

moví 8(%ebp),%ebx 

leal (%ebx, %edx, 4) , %eax 

pushl %eax 

pushl %ebx 

cali DOT 

addl $12,%esp 



Bloque de 
Activación ■{ 
de PDOT 



+8 
+12 



VJC31IUI 1 


de 
uc 
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13. Recoger/usar resultado 



oid PDOT(int M[10][10], int *p) { 
*p = Ó; 

for (i=0; i<10; i++) 

*p += DOT(&M[0] [0] ,&M[i] [0] , 10) ; 



pushl $10 

imull $10, -4 (%ebp) , %edx 

moví 8(%ebp),%ebx 

leal (%ebx, %edx, 4) , %eax 

pushl %eax 

pushl %ebx 

cali DOT 

addl $12,%esp 

moví 12 (%ebp) , %ebx 

addl %eax, (%ebx) 



Bloque de 
Activación < 
de PDOT 



+8 
+12 
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1 Paso de parámetros 

2 llamada subrutina 

12 elimina parámetros 

13 Recoger/usar resultado 



DOT: 

3 Enlace dinámico, puntero bloque de 
activación 

4 Reserva espacio variables locales 

5 Salvar estado llamador 

6 Cuerpo subrutina 

7 Mover resultado a eax 

8 Restaura estado 

9 elimina variables locales 

10 Deshacer enlace dinámico 

11 retorno de subrutina 
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typedef struct { 
char el; 
char *p ; 

unsigned short M[3] [3] ; 
int a; 
char c2; 
} X; 

int rut (char c, char d, int v[4]) 
{ 



X vx[5] ; 
char a; 
char b; 
int i; 



1 1 | < 



M[l] [0] 
M[l] [2] 



I 



M[0] [2] 
M[l] [1] 



I I 1 ° 2 



- +0 

- +4 

- +8 



- +28 

- +32 



vx[0] 




vx[l] 




vx[2] 




vx [3] 




vx[4] 




mm b i a 




i 




ebp 




@ret 








c 










d 




V 





-80 
-44 



-4 
-ebp 

-+8 
-+12 
+16 
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typedef struct { 
char el; 
char *p ; 

unsigned short M[3] [3] ; 
int a; 
char c2; 
} X; 

int rut2 (X sx, X *px) 
{ 



ebp 




@ret 


1 1 l=i 




P 




M[0] [1] 


M[0] [0] 




M[l] [0] 


M[0] [2] 


M[l] [2] 


M[l] [1] 


M[2] [1] 


M[2] [0] 


1 


M[2] [2] 
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px 





-ebp 

- +8 

- +12 

- +16 



- +36 

- +40 
-+44 



